期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 机器翻译自动评价中领域知识复述抽取研究
张丽林, 李茂西, 肖文艳, 万剑怡, 王明文
北京大学学报自然科学版    2017, 53 (2): 230-238.   DOI: 10.13209/j.0479-8023.2017.030
摘要649)   HTML19)    PDF(pc) (355KB)(273)    收藏

针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务的应用中容易出现复述匹配偏差的问题, 提出采用抽取与测试领域相关的复述来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类, 并利用改进的M-L方法过滤, 得到特定领域训练语料, 然后在训练语料中利用Markov网络模型, 抽取特定领域复述表, 最后将此复述表应用在机器译文自动评价中, 以提高同义词和近义词的匹配精度。在WMT’14 Metrics task和WMT’15 Metrics task数据集上的实验结果表明, 利用领域知识抽取的复述能够增加自动评价方法METEOR和TER与人工评价的相关性。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
2. 结合语义的位置语言模型
余伟,王明文,万剑怡,左家莉
北京大学学报(自然科学版)   
摘要724)      PDF(pc) (558KB)(394)    收藏
针对位置语言模型没有考虑词与词之间语义关系的问题, 提出一种结合语义的位置语言模型。首先采用高斯核函数来度量词与词之间的位置关系; 然后提出一种平滑互信息的技术来度量词与词之间的语义关系, 证明了平滑互信息能够有效解决大量词对之间无法通过互信息来计算转移概率的问题; 还证明了位置语言模型是结合语义位置语言模型的一个特例; 最后将结合语义的位置语言模型应用于信息检索, 得到一个基于该模型的检索模型。实验结果表明, 基于该模型的检索模型在性能方面要优于基于位置语言模型的检索模型。
相关文章 | 多维度评价 | 评论0